網頁相關部分暫時先告一段落(雖然也沒剩幾天了)
前幾次跟老師meeting的時候提到鐵人賽要寫Azure
老師就特別說Microsoft的語音文字做得不錯
想說可以來研究研究
所以剩下的時間應該差不多可以都用在這部分
總之是個幾乎全然陌生的東西
就先來找找資料吧!
首先應該可以很容易的找到Azure關於語音及文字轉換的文件。
另外在下方也有以各種程式語言實現的軟體開發套件SDK(Software Development Kit),並且也可以看到有REST API的說明連結。
到概觀的左上角仔細一看,可以看到語音服務
是在認知服務
之下,那認知服務是什麼呢?點進去看看。
了解如何在應用程式、網站和 Bot 中融入智慧型和支援的演算法,來查看、聆聽、述說、了解及詮釋您的使用者需求。
除了語音服務之外,還有視覺、語言、搜尋等等幫助了解使用者的服務,除此之外還可以發現認知服務和機器學習
,原來還要會機器學習!?
認知服務提供機器學習功能來解決一般問題,例如分析文字的情緒情感,或分析影像以辨識物件或臉部。 您不需要特殊的機器學習或資料科學知識,就可以使用這些服務。
看來Azure也知道大家會害怕,文件的第一段就直接這樣寫道XD 那認知服務跟機器學習又是什麼關係呢?
認知服務會在機器學習解決方案中提供部分或所有元件:資料、演算法和定型模型。 這些服務的目的是要要求資料的一般知識,而不需要使用機器學習或資料科學的經驗。 這些服務同時提供 REST API 和以語言為基礎的 Sdk。 因此,您必須具備程式設計語言知識,才能使用服務。
似乎跟PaaS相較於IaaS的概念有點類似,Azure提供部分甚至全部的演算法或模型,透過REST API或是各語言的軟體開發套件就可以應用機器學習來解決某些問題,而不需要自己處理資料、訓練等等。
而認知服務中的語音服務,我想就是使用Azure訓練完成的模型,透過REST API傳入語音檔案或是文字檔案,並回傳辨識完成的結果,SDK方面應該也是類似,但有更多細節可以自己撰寫程式碼來設計。
明天開始就來實際使用看看Azure語音服務吧!